ভেদাংক (Variance), বিভেদাংক (Dispersion), ও সহভেদাংক (Coefficient of Variation)
পরিসংখ্যানের এই তিনটি গুরুত্বপূর্ণ মাপকাঠি ডেটাসেটের বৈচিত্র্য, স্থিতিশীলতা এবং তুলনামূলক বৈশিষ্ট্য নির্ধারণে ব্যবহৃত হয়। এগুলো সম্পর্কে বিস্তারিত আলোচনা নিচে উপস্থাপন করা হলো।
ভেদাংক (Variance)
সংজ্ঞা:
ভেদাংক হলো একটি ডেটাসেটের মানগুলোর গড় থেকে কতটা বিচ্যুতি ঘটেছে তার গড় বর্গ। এটি ডেটাসেটের বৈচিত্র্য পরিমাপের জন্য একটি গুরুত্বপূর্ণ মাপকাঠি।

ভেদাংক নির্ণয়ের সূত্র:
যেখানে,

উদাহরণ:

বৈশিষ্ট্য:
- এটি ডেটাসেটের বৈচিত্র্যের একটি নির্ভুল পরিমাপ।
- বর্গমূলের মাধ্যমে মান বিচ্যুতি (Standard Deviation) নির্ণয় করা যায়।
বিভেদাংক (Dispersion)
সংজ্ঞা:
বিভেদাংক হলো ডেটাসেটের মানগুলোর ছড়িয়ে পড়া বা বৈচিত্র্যের পরিমাপ। এটি ডেটার সর্বোচ্চ ও সর্বনিম্ন মানের মধ্যকার পার্থক্য, গড় থেকে বিচ্যুতি, বা অন্যান্য সূচকের মাধ্যমে নির্ধারণ করা হয়।
প্রকারভেদ:
১. বিস্তার (Range): সর্বোচ্চ এবং সর্বনিম্ন মানের পার্থক্য।
Range = Maximum Value - Minimum Value
২. আন্তঃচতুর্ভাগ বিস্তার (Interquartile Range - IQR):
IQR= Q3 - Q1
৩. গড় বিচ্যুতি (Mean Deviation):

৪. মান বিচ্যুতি (Standard Deviation):

গুরুত্ব:
- ডেটাসেটের বৈচিত্র্য এবং স্থিতিশীলতা নির্ধারণে বিভেদাংক গুরুত্বপূর্ণ ভূমিকা পালন করে।
- এটি বহিরাগত মান বা অস্বাভাবিক বৈচিত্র্য সনাক্তে সহায়তা করে।
সহভেদাংক (Coefficient of Variation - CV)
সংজ্ঞা:
সহভেদাংক হলো ডেটাসেটের মান বিচ্যুতি এবং গড়ের অনুপাত, যা শতাংশে প্রকাশ করা হয়। এটি বিভিন্ন ডেটাসেটের তুলনা করার জন্য ব্যবহৃত হয়।

সহভেদাংক নির্ণয়ের সূত্র:
যেখানে,

উদাহরণ:

গুরুত্ব:
- সহভেদাংক ডেটাসেটের আপেক্ষিক বৈচিত্র্য প্রকাশ করে।
- এটি ভিন্ন একক বিশিষ্ট ডেটাসেটের তুলনার জন্য কার্যকর।
তুলনামূলক আলোচনা
| বিষয় | ভেদাংক (Variance) | বিভেদাংক (Dispersion) | সহভেদাংক (CV) |
|---|---|---|---|
| সংজ্ঞা | ডেটার গড় থেকে বিচ্যুতির গড় বর্গ | ডেটার বৈচিত্র্য পরিমাপ | আপেক্ষিক বৈচিত্র্য শতাংশে প্রকাশ |
| পরিমাপের একক | ডেটার বর্গ এককে (Squared Units) | ডেটার মূল এককে (Original Units) | শতাংশে (Percentage) |
| ব্যবহার | বৈচিত্র্য এবং স্থিতিশীলতা নির্ধারণ | বৈচিত্র্যের প্রকৃতি বোঝার জন্য | তুলনামূলক বিশ্লেষণে |
| প্রভাবিত চরম মান দ্বারা | হ্যাঁ | নির্ভর করে | নির্ভর করে |
সারসংক্ষেপ
- ভেদাংক ডেটাসেটের মানগুলোর গড় থেকে বিচ্যুতি নির্ধারণে কার্যকর।
- বিভেদাংক ডেটাসেটের বৈচিত্র্য সম্পর্কে সামগ্রিক ধারণা দেয়।
- সহভেদাংক বিভিন্ন ডেটাসেটের আপেক্ষিক বৈচিত্র্য তুলনা করতে ব্যবহৃত হয়।
এই তিনটি মাপকাঠি ডেটা বিশ্লেষণে ভিন্ন ভিন্ন প্রয়োজনে ব্যবহৃত হয় এবং প্রতিটির নিজস্ব গুরুত্ব রয়েছে।
Read more